import pandas as pd
df1=pd.read_excel('附件1.xlsx')
#查看表格是否有缺值
print(df1.info())
#查看表格是否有完全重复行
print(df1[df1.duplicated(keep=False)])
#对所有行进行格式化并完成任务要求
df1['产品通用名称'].replace('\s+','',regex=True,inplace=True)
a={'有机－无机复混肥料': '有机-无机复混肥料','有机无机复混肥料': '有机-无机复混肥料',
   '稻苗床土调酸剂':'床土调酸剂','掺混肥料':'复混肥料'}
df1['产品通用名称'] = df1['产品通用名称'].astype(str).replace((a))
#查看某一列每个相同值的数量
print(df1['产品通用名称'].value_counts())
#异常值处理：转换时间格式后再用excel处理
df1['发证日期']=pd.to_datetime(df1['发证日期'])
df1['有效期']=pd.to_datetime(df1['有效期'])
df1.to_excel('result1_1.xlsx',index=False)







